AI资讯新闻榜单内容搜索-Claude 3

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Claude 3
连Claude 3.5都败下阵来,大语言模型能否定位软件服务的故障根因?

连Claude 3.5都败下阵来,大语言模型能否定位软件服务的故障根因?

连Claude 3.5都败下阵来,大语言模型能否定位软件服务的故障根因?

论文的第一作者是香港中文大学(深圳)数据科学学院三年级博士生徐俊杰龙,指导老师为香港中文大学(深圳)数据科学学院的贺品嘉教授和微软主管研究员何世林博士。贺品嘉老师团队的研究重点是软件工程、LLM for DevOps、大模型安全。

来自主题: AI技术研报
5685 点击    2025-04-22 17:58
谷歌首款混合推理Gemini 2.5登场,成本暴降600%!思考模式一开,直追o4-mini

谷歌首款混合推理Gemini 2.5登场,成本暴降600%!思考模式一开,直追o4-mini

谷歌首款混合推理Gemini 2.5登场,成本暴降600%!思考模式一开,直追o4-mini

谷歌发布首款混合推理模型Gemini 2.5 Flash,引入了革命性「思考预算」,可灵活控制推理深度,性能一举击败Claude 3.7,比肩o4-mini。而且,关闭思考模式成本直降600%。

来自主题: AI资讯
9266 点击    2025-04-18 10:48
GPT-4.1全网实测来袭,惨遭谷歌Gemini碾压!大佬猜测:从GPT-4.5蒸馏的

GPT-4.1全网实测来袭,惨遭谷歌Gemini碾压!大佬猜测:从GPT-4.5蒸馏的

GPT-4.1全网实测来袭,惨遭谷歌Gemini碾压!大佬猜测:从GPT-4.5蒸馏的

两个月后就号称要淘汰GPT-4.5的GPT-4.1,实力究竟如何?在众多实测中,它的表现的确可圈可点,但却依然打不过Gemini 2.5 Pro和Claude 3.7 Sonnet。那么问题来了,OpenAI为何要发布一个远远落后于谷歌的模型?

来自主题: AI资讯
7894 点击    2025-04-16 10:26
Gemini 2.5编程全球霸榜,谷歌重回AI王座!神秘模型曝光,奥特曼迎战

Gemini 2.5编程全球霸榜,谷歌重回AI王座!神秘模型曝光,奥特曼迎战

Gemini 2.5编程全球霸榜,谷歌重回AI王座!神秘模型曝光,奥特曼迎战

刚刚,Gemini 2.5 Pro编程登顶,6美元性价比碾压Claude 3.7 Sonnet。不仅如此,谷歌还暗藏着更强的编程模型Dragontail,这次是要彻底翻盘了。

来自主题: AI资讯
7754 点击    2025-04-14 19:38
Anthropic首次切开Claude大脑,「AI黑箱」彻底破解?心算诡异思考过程曝光

Anthropic首次切开Claude大脑,「AI黑箱」彻底破解?心算诡异思考过程曝光

Anthropic首次切开Claude大脑,「AI黑箱」彻底破解?心算诡异思考过程曝光

AI的运作始终笼罩着一层神秘的「黑箱」迷雾。这种不透明让AI有时会「胡说八道」,甚至故意撒谎。Anthropic刚刚推出了一项突破性研究,用类似大脑扫描的技术,深入Claude 3.5 Haiku的「脑子」,揭开了它运行的一些秘密。

来自主题: AI资讯
8818 点击    2025-03-28 17:45
DeepSeek-V3深夜惊爆上新!代码数学飙升剑指GPT-5,一台Mac可跑

DeepSeek-V3深夜惊爆上新!代码数学飙升剑指GPT-5,一台Mac可跑

DeepSeek-V3深夜惊爆上新!代码数学飙升剑指GPT-5,一台Mac可跑

685B的DeepSeek-V3新版本,就在昨夜悄悄上线了。参数量685B的V3,代码数学推理再次显著提升,甚至代码追平Claude 3.7,网友们实测后大呼强到离谱!有人预测说,按照此前的节奏,DeepSeek-R2大概率几周内就将上线。

来自主题: AI技术研报
9219 点击    2025-03-25 12:09
Nature:科研人员最爱AI工具大盘点!从推理到编程,哪款才是最佳助手?

Nature:科研人员最爱AI工具大盘点!从推理到编程,哪款才是最佳助手?

Nature:科研人员最爱AI工具大盘点!从推理到编程,哪款才是最佳助手?

本文介绍了当前最受科研人员青睐的AI模型,推理出色的o3-mini、全能型DeepSeek-R1、科研常用的Llama、编程利器Claude 3.5 Sonnet和开源明星Olmo 2,它们各有优劣,为科研人员提供了多样选择。

来自主题: AI资讯
9003 点击    2025-03-25 11:53
重磅! Claude 3.7 Max上线Cursor :史上最强,代码能力再次飞跃

重磅! Claude 3.7 Max上线Cursor :史上最强,代码能力再次飞跃

重磅! Claude 3.7 Max上线Cursor :史上最强,代码能力再次飞跃

刚刚!代码神器 Cursor 宣布推出全新模型 Claude 3.7 Max!简单来说就是Claude 3.7 的完全体形态抢先体验,号称能力远超以往,专为硬核开发者打造!一句话总结 Claude 3.7 Max: 更强、更快、更贵,专为解决复杂代码难题而生!

来自主题: AI资讯
10028 点击    2025-03-18 21:52
「死了么」APP上线——Claude3.7生成高保真原型UI 2.0

「死了么」APP上线——Claude3.7生成高保真原型UI 2.0

「死了么」APP上线——Claude3.7生成高保真原型UI 2.0

传统的App原型设计需要专业的设计技能、复杂的工具操作和大量的时间投入。而现在,借助Cursor+Claude 3.7的组合,一段精心设计的提示词就能完成这一切。

来自主题: AI资讯
7060 点击    2025-03-18 17:59